Sinh ngôn ngữ tự nhiên
Sinh ngôn ngữ tự nhiên (hay còn gọi là sản sinh ngôn ngữ tự nhiên, tạo sinh ngôn ngữ tự nhiên, phát sinh ngôn ngữ tự nhiên, tiếng Anh: natural-language generation, viết tắt NLG) là một quy trình phần mềm, chuyển đổi dữ liệu có cấu trúc thành ngôn ngữ tự nhiên.[1] NLG cũng có thể dùng để sản sinh dạng nội dung dài cho các tổ chức để tự động các báo cáo tùy chỉnh, cũng như sản sinh nội dung tùy chỉnh cho các ứng dụng web hay mobile. Sinh ngôn ngữ tự nhiên cũng có thể dùng để sản sinh các đoạn văn bản mờ ngắn trong các cuộc tương tác trò chuyện (thậm chí một chatbot có thể được đọc ra bởi một hệ thống tổng hợp giọng nói).
NLG được tự động có thể dùng để so sánh với quá trình mà con người sử dụng khi chuyển hóa các ý tưởng của mình thành văn bản hoặc bài phát biểu. Các nhà tâm lý học ưa thích sử dụng thuật ngữ sản xuất ngôn ngữ (language production) hơn cho quá trình này, cũng như có thể được diễn tả bằng các thuật ngữ toán học, hoặc mô hình hóa trong một máy tính cho nghiên cứu tâm lý.
Các hệ thống NLG cũng có thể được so sánh với các bộ phiên dịch các ngôn ngữ máy tính nhân tạo, chẳng hạn như các trình dịch ngược (decompiler) hay các trình biên dịch nguồn sang nguồn (source-to-source compiler), mà cũng tạo ra mã mà con người có thể đọc được, sản sinh từ một biểu diễn trung gian (intermediate representation). Ngôn ngữ con người thông thường có xu hướng phức tạp hơn một cách đáng kể và cho phép diễn đạt sự mơ hồ (ambiguity) hơn nhiều so với ngôn ngữ lập trình, điều này khiến việc giải quyết các bài toán về NLG trở nên thách thức hơn. Hiện tại, có hai phương pháp để đánh giá các hệ thống NLG: đánh giá con người và đo lường tự động.[2]
Tham khảo
[sửa | sửa mã nguồn]- ^ What is Natural Language Generation (NLG)?
- ^ “Google AI Blog: Evaluating Natural Language Generation with BLEURT”. Truy cập 23 tháng 2 năm 2021.
Đọc thêm
[sửa | sửa mã nguồn]- Dale, Robert; Reiter, Ehud (2000). Building natural language generation systems. Cambridge, UK: Cambridge University Press. ISBN 978-0-521-02451-8.
- Evans, Roger; Piwek, Paul; Cahill, Lynne (2002). “What is NLG?”. New York, US. Đã bỏ qua tham số không rõ
|conference=
(trợ giúp) paper - Gatt, Albert; Krahmer, Emiel (2018). “Survey of the State of the Art in Natural Language Generation: Core tasks, applications and evaluation”. Journal of Artificial Intelligence Research. 61: 65–170. arXiv:1703.09902. doi:10.1613/jair.5477.
- Reiter, Ehud (ngày 16 tháng 1 năm 2018). “How do I Learn about NLG?”.
Liên kết ngoài
[sửa | sửa mã nguồn]- ACL Special Interest Group on Generation (SIGGEN)
- SIGGEN part of ACL Anthology (contains NLG research papers)
- ACL NLG Portal (contains list of NLG resources)
- Bateman and Zock's 'almost complete' list of NLG systems Lưu trữ 2020-02-17 tại Wayback Machine now maintained as a Wiki with a variety of visualisations and overview tables available on demand
- RosaeNLG RosaeNLG is an open-source (MIT) NLG library written in JavaScript, based on the Pug template engine (supports any language and is currently shipped with resources for English, French, German and Italian)
- KPML — general-purpose natural language generation system with graphical user interface for development and grammars of varying sizes for Chinese, Czech, Dutch, English, French, German, Greek, Japanese, Portuguese, Russian and Spanish
- SimpleNLG-EnFr Lưu trữ 2020-06-27 tại Wayback Machine — Open source Java library adaption of SimpleNLG which adds French support.
- Cerebellum — Character-based Language Model generator for English, Georgian, Hungarian, Japanese, Russian, Turkish, Slovak, Czech and Latin
- Interactive Multimedia Explanation for Equipment Maintenance and Repair - article describing Coordinated Multimedia Explanation Testbed (COMET)